期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于差分隐私的高精度直方图发布方法
李昆明, 王超迁, 倪巍伟, 鲍晓涵
计算机应用    2020, 40 (11): 3242-3248.   DOI: 10.11772/j.issn.1001-9081.2020030379
摘要420)      PDF (626KB)(420)    收藏
针对已有基于分组平抑差分噪声误差的隐私保护直方图发布方法无法有效均衡分组近似误差与差分隐私(DP)拉普拉斯误差,从而造成直方图可用性缺失的问题,提出基于差分隐私的高精度直方图发布方法(HPHP)。首先,采用约束推断方法,在满足DP约束的前提下实现直方图排序;然后,基于有序直方图,采用动态规划分组方法在添加噪声的直方图上生成具有最小总误差的分组;最后,在各组均值上添加拉普拉斯噪声。方便对比分析起见,提出具有理论最小误差的隐私保护直方图发布方法(Optimal)。将HPHP与直接添加噪声的DP方法、AHP方法以及Optimal进行实验分析,实验结果表明:相较于AHP方法,HPHP所发布直方图的Kullback-Leibler散度(KLD)能够降低90%,接近Optimal的效果。因此,在相同的预置条件下,HPHP可以在保证满足DP的前提下发布更高精度的直方图。
参考文献 | 相关文章 | 多维度评价
2. 基于局部密度的快速离群点检测算法
邹云峰, 张昕, 宋世渊, 倪巍伟
计算机应用    2017, 37 (10): 2932-2937.   DOI: 10.11772/j.issn.1001-9081.2017.10.2932
摘要501)      PDF (914KB)(444)    收藏
已有的密度离群点检测算法LOF不能适应数据分布异常情况离群点检测,INFLO算法虽引入反向 k近邻点集有效地解决了数据分布异常情况的离群点检测问题,但存在需要对所有数据点不加区分地分析其 k近邻和反向 k近邻点集导致的效率降低问题。针对该问题,提出局部密度离群点检测算法--LDBO,引入强 k近邻点和弱k近邻点概念,通过分析邻近数据点的离群相关性,对数据点区别对待;并提出数据点离群性预判断策略,尽可能避免不必要的反向 k近邻分析,有效提高数据分布异常情况离群点检测算法的效率。理论分析和实验结果表明,LDBO算法效率优于INFLO,算法是有效可行的。
参考文献 | 相关文章 | 多维度评价
3. 一种面向专利文献数据的文本自动分类方法
蒋健安 陆介平 倪巍伟 孙志挥
计算机应用   
摘要1677)      PDF (629KB)(1123)    收藏
中文专利文献自动分类目前尚无成熟适用的方法。分析了文本自动分类的关键技术,并结合专利数据的特点对无词典分词和权重计算进行了改进,提出了一种适用于专利数据分类的层次分类方法,给出了面向专利文献数据的文本自动分类系统的框架模型。实验表明,该系统具有较好的分类精度与效率。
相关文章 | 多维度评价
4. 一种基于局部密度的快速离群点检测算法
邹云峰 张昕 宋世渊 倪巍伟
  
录用日期: 2017-06-15